基于数据空间构建数据生态系统
数据生态系统是多个利益相关者协作和共享数据活动发生的空间。在各方之间实现可靠的数据共享需要技术中立的协议和标准,用于规定组织和个人参与数据共享活动的方式,根据共同同意的规则和指令行事。在基于数据空间构建的数据生态系统中,所有参与者实施相同的基础协议和标准,这些基础协议和标准充分考虑了国家和区域层面、行业层面及参与者之间的相关政策、法律、规则和协议。通过数据空间,可将这些基础协议和标准可以技术执行的策略,从而实现企业内部、企业之间、城市公共管理,以及跨国的数据共享。
构建数据生态系统的三个层面
基于数据空间构建数据生态系统,需从商业、治理、技术三个层面开展。
在商业层面,需要定义业务模式和参与者的激励机制。数据空间服务必须对数据提供者和数据消费者具有吸引力,同时需要制定有效的激励机制来确保数据提供者能够提供高质量的数据。此外,在基于数据空间的商业模式形成之前,需要预先对数据空间进行投资,这里的资金和融资模式也须考虑到数据空间作为基础设施的公共性。
在治理层面,数据空间既可以盈利为目的成立,也可以非盈利为目的成立。各方必须制定协作数据治理协作机制,以确定数据空间中的数据可见性、透明度和数据自主权。数据治理的核心要素是达成共识的规则。例如,数据提供者可以选择允许任何数据空间参与者访问其数据源,或者限制数据访问仅限于特定用户组。
在技术层面,需要定义数据的标准化交换和互操作性,包括定义数据共享结构和格式、定义数据资产的元数据表述、定义可以对数据资产执行的格式转换等数据服务操作以及定义管理如何访问、修改或删除数据的使用策略。
数据连接器是一种软件工具,可用于在各种系统、应用程序和数据源之间共享和集成数据。在基于数据空间的生态系统中,连接器在符合数据空间协议的预定义标准和交换策略的不同平台、系统和组织之间的通信和数据交换中发挥着关键作用。
由于数据空间技术架构具有开放性,实践中,参与者可以直接根据开源社群的公开资源开发自己的连接器。但是,参与者自行开发的连接器存在没有满足数据空间架构要求的可能性,从而为数据空间中的交互带来不便,并且可能引发安全风险。因此,必须通过认证机制确保每个参与者的连接器都符合数据空间的架构要求。每一个数据空间的参与者都必须通过经过认证的连接器来传送数据。参与者可以自己部署连接器并获得认证,也可以使用供应商提供的经认证的连接器。
关键角色及其准入机制
基于数据空间构建数据生态系统,至少需要以下三个核心角色:
· 数据提供者——管理要共享的数据资产,确保数据质量并确定使用政策。
· 数据消费者——根据商定的合同访问和使用数据,可能将数据用于分析、决策、研究或其他应用。
· 运营机构—运营机构可以管理一个或多个数据空间,其职能包括管理数据空间,负责参与者注册、认证以及执行技术要求和规则等。
随着数据空间运行的成熟,可以引入其他角色的参与方。例如:(1)应用程序提供商:负责开发和提供使用数据空间内的数据的软件应用程序的主体。(2)新加入的合作伙伴:将新的数据源、新的数据提供者或数据消费者带到数据空间的主体。(3)技术服务商:在数据空间内提供技术服务的主体,如提供数据质量、隐私保护、数据安全、运行状况检测等技术服务的企业。
认证是在数据空间生态系统中实现各参与方之间信任的关键。认证能够为参与者提供对数据空间生态可信性的确认。数据空间中可能存在许多不同的机构,这些机构彼此之间并不一定互相了解。新加入的参与者必须能够确认其所在的环境是安全的,并且该环境中的其他参与者与其遵守共同的规则。对操作环境的认证可用于确保组织和运行环境的安全性,这不仅包括对物理意义上运行环境的认证,还包括对参与者的相关程序和组织规则的认证,例如谁有访问服务器的权限、是否有与其他机构之间进行数据访问的规则以及负责人等。有了认证机制,新加入方就可以在不了解任何其他参与方的情况下进入数据空间。
数据生态系统的形成和演进
数据生态系统的形成是一个涉及多利益相关方协调的系统过程。在构建基于数据空间的数据生态系统时,可以重点围绕以下几步逐步展开:
(1)凝聚共识:所有参与方应在创建一个以数据自主权为关键原则的基础协议和标准上达成共识,通过数据的价值赋能个人或组织。(2)设计规划:将先前分散的各个数据共享流通做法聚合和统一起来,通过技术标准化和试验验证,最终部署在一个共同的、通用的基础协议和标准体系上。(3)标准化:定义数据交换标准化和互操作性基础的关键概念和组件,包括数据表示和分类、数据资产、数据服务、使用策略等。(4)试验部署:进行试验部署,通过实践验证技术方案和标准的可行性,优化技术实现和操作流程。(5)规模应用与反复迭代:在具备以上基本要素后,逐步扩展数据空间的规模应用,并根据实际应用中的反馈不断进行优化和改进。
基于数据空间所构建的数据生态系统,可分为三个演进阶段:
封闭生态系统:数据空间生态系统主要由已知的参与者组成,数据交换需求较低。主要通过联盟建立信任,参与者之间的关系相对稳定,数据共享和协作较为简单,例如企业数据空间。封闭生态系统的特点包括:
· 参与者之间相互了解,信任基础较为牢固。
· 数据交换需求较低,数据共享和协作较为简单。
· 通过联盟建立信任,确保数据共享的可靠性和安全性。
开放生态系统:在开放生态系统阶段,数据空间的参与者变得更加动态,可以随时进入和退出数据空间。数据交换需求增加,对数据空间的信任和互操作性要求也随之提高。需要通过组件和环境测试与认证实现信任,开放生态系统的特点包括:
· 动态参与者:参与者可以随时进入和退出数据空间,增加了灵活性和适应性。
· 高数据交换需求:数据交换需求增加,数据共享和协作变得更加复杂。
· 信任和互操作性:通过组件和环境测试与认证实现信任,确保数据共享的可靠性和安全性。
联邦生态系统:在联邦生态系统阶段,数据空间的参与者不仅属于一个生态系统,而且是多个生态系统的成员。实现跨生态系统边界的数据共享,提出更高的信任和互操作性要求。联邦生态系统的特点包括:
· 多生态系统成员:参与者不仅属于一个生态系统,而且是多个生态系统的成员。
· 跨生态系统数据共享:实现跨生态系统边界的数据共享,数据共享活动的复杂性增加。
· 高信任水平和互操作性:对信任和互操作性提出更高的要求,认证机制和标准化的重要性进一步提升,以确保跨生态系统的数据共享的可靠性和安全性。
数据生态系统的构建和演进,代表着数据共享从封闭到开放,再到跨生态系统交互的不断发展过程。基于数据空间构建的数据生态系统,不仅为各类参与者提供了一个可靠、安全的数据流通环境,更重要的是通过一系列标准化协议和技术规范以及统一的认证机制,打破数据孤岛,实现跨组织、跨行业、跨国界的数据流通和共享,为全球范围内各行业、各主体的数据开放、业务协作和创新奠定坚实的基础。
产品服务
01
前瞻研究
02
03
数据信任与治理
“数据信任与治理”由下一代互联网国家工程中心运营。放眼全球数据治理前沿理论与实践进展,探索可信数据治理的中国模式,促进数据要素有序流通,释放数字经济红利。
TDG focuses on the cutting-edge theory and practice of global data governance, explores the Chinese model of trusted data governance, promotes global data flow, and fulfills the potential of the digital economy.